AI资讯新闻榜单内容搜索-LLM

登顶Hugging Face论文热榜，LLM重写数据准备的游戏规则

来自上海交通大学、清华大学、微软研究院、麻省理工学院（MIT）、上海 AI Lab、小红书、阿里巴巴、港科大（广州）等机构的研究团队，系统梳理了近年来大语言模型在数据准备流程中的角色变化，试图回答一个业界关心的问题：LLM 能否成为下一代数据管道的「智能语义中枢」，彻底重构数据准备的范式？

来自主题: AI技术研报

7862 点击 2026-02-09 11:12

过去一年，LLM Agent几乎成为所有 AI 研究团队与工业界的共同方向。OpenAI在持续推进更强的推理与工具使用能力，Google DeepMind将推理显式建模为搜索问题，Anthropic则通过规范与自我批判提升模型可靠性。

来自主题: AI技术研报

9560 点击 2026-02-07 14:04

在 LLM 时代，思维链（ CoT）已成为解锁模型复杂推理能力的关键钥匙。然而，CoT 的冗长问题一直困扰着研究者——中间推理步骤和解码操作带来了巨大的计算开销和显存占用，严重制约了模型的推理效率。

来自主题: AI技术研报

6936 点击 2026-01-27 16:17

2025 年 1 月 20 日，DeepSeek（深度求索）正式发布了 DeepSeek-R1 模型，并由此开启了新的开源 LLM 时代。在 Hugging Face 刚刚发布的《「DeepSeek 时刻」一周年记》博客中，DeepSeek-R1 也是该平台上获赞最多的模型。

来自主题: AI资讯

10202 点击 2026-01-21 09:51

如果人类的大脑像现在的LLM Agent一样工作，记住每一句今天明天的废话，我们在五岁时就会因为内存溢出而宕机。真正的智能，核心不在于“存储”，而在于高效的“遗忘”与“重组”。

来自主题: AI技术研报

8428 点击 2026-01-15 09:22

站在 2026 年的开端回望，LLM 的架构之争似乎进入了一个新的微妙阶段。过去几年，Transformer 架构以绝对的统治力横扫了人工智能领域，但随着算力成本的博弈和对推理效率的极致追求，挑战者们从未停止过脚步。

来自主题: AI技术研报

9157 点击 2026-01-14 15:25

在大模型智能体（LLM Agent）落地过程中，复杂工作流的高效执行、资源冲突、跨框架兼容、分布式部署等问题一直困扰着开发者。而一款名为Maze的分布式智能体工作流框架，正以任务级精细化管理、智能资源调度、多场景部署支持等核心优势，为这些痛点提供一站式解决方案。

来自主题: AI资讯

8367 点击 2025-12-30 15:14

在 LLM Agent 领域，有一个常见的问题：Agent 明明 "看到了" 错误信息，却总是重蹈覆辙。

来自主题: AI技术研报

8023 点击 2025-12-30 09:54

LLM 智能体很赞，正在成为一种解决复杂难题的强大范式。

来自主题: AI技术研报

8377 点击 2025-12-17 14:58

扩散语言模型（Diffusion Language Models）以其独特的 “全局规划” 与并行解码能力广为人知，成为 LLM 领域的全新范式之一。然而在 Any-order 解码模式下，其通常面临

来自主题: AI技术研报

7231 点击 2025-12-13 10:59